搜索资源列表
Test
- 分词统计 能应用于Java环境下 效率高-aaaaaaaa Word statistics and Segmentation a d dfddfdf
heritrix-1.14.3-src
- 高性能分词算法,采用java实现,能自动进行最小分词,用户可以筛选分词类别-Word segmentation algorithm for high-performance, the realization of the use of java, can automatically carry out the smallest sub-word, the user can filter category segmentation
libstemmer_java
- linux系统下的分词软件,由java编写,我刚开始在windows下使用,折腾了两天,才发现在linux下-stemmer
Wordseg
- 该程序是采用的java语言对测试文本进行中文分词-Chinese segmenter
textcluster
- java文本聚类程序代码文件,实现文本聚类功能,分词。-text clustering java code files to achieve text clustering features, sub-word.
fenciqiusedic
- 用java写的分词器,可以利用此程序分析一段话中的单词,根据词典的不同,分析的结果也不同-Using java to write the word breaker, you can take advantage of this program analysis passage of the word, according to the dictionary is different from results of the analysis are also different
fenci
- 中文分词代码,利用Java写的关于搜索的中文分词-Chinese word segmentation code, the use of Java to write about the Chinese word search
hlfc_java_sourcecode
- 海量分词的共享版的java源码,值得学习,对中文分词有很高的精度-Massive word shared version of the java source code, it is worth learning for Chinese word has a high accuracy
windows_csharp_32
- 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。ICTCLAS全部采用C/C++编写,支持Linux、FreeBSD及Windows系列操作系统,支持C/C++/C#/Delphi/Java等主流的开发语言
IKAnalyzer3.2.0Stable_src
- IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。 IKAnalyzer3.0特性: 采用了特有的“正向迭代最细粒度切分算法“,具有60万字/秒的高速处理能力。
HZ_Freq
- java中文分词系统,可供大家学习,祝成功路上越走越远!-Java wordseg program
yinghanshuangxiangdianzicidian
- 英汉双向电子词典是数字化的辞书,在载体、编纂方式、设计过程、功能、使用者、查询手段、检索方法等各方面具有词典类软件特性。本课题设计英汉双向电子词典是一种基于Java语言开发的跨平台的词典类工具软件。检索方式采用开源的Lucene全文检索并实现中文分词的功能。具有查询、检索方便、快捷,查询种类齐全,可以即时翻译、准确的、详细地查阅英文、中文单词。同时为各种软件、网络、电子邮件等提供后台支持,从而大大提高了用户的工作效率,拓宽了学习途径。-English-to-Chinese a the book
fenci
- 将该jar包导入到用户创建的工程中,然后在用户创建的类中调用其中的分词功能。-Import this fenci.jar into user s project, and call it in the .java file to segment Chinese words
ChineseWordsDemo
- 中文分词系统的java源代码,中文分词中文分词中文分词中文分词-Chinese word java
InPutTextFile
- java中文分词系统,很好用的。欢迎下载与修改,并提出宝贵意见。-chinese words splitting system
sse4j
- SSE4J(Spatial Search Engine for Java)是针对地理信息数据源构建的垂直搜索引擎应用接口,是基于Lucene+JTS Topology Suite开源库设计的框架。 规划的SSE4J包含: 1)SSE4J应用开发包 2)SSE4J Webservice应用接口 3)SSE4J工具集 规划的SSE4J包含的功能: 1) POI搜索(名称、地址、类型等关键字搜索;周边搜索) 2)道路搜索、区域搜索 3)地址匹配、
Miniseg
- 用java实现的一个小型分词程序,可以将词语分隔开来,但缺乏标注,如:他 喜欢 吃 苹果 。-Achieved with a small java program segmentation, words can be separated, but the lack of marking, such as: He likes to eat apples.
ictclas4j
- 本代码用java实现了分词功能,包括分词和词性标注,里面有具体的说明文档,包括数据结构的设计,分词步骤,分词系统研究等。-The code is implemented using java segmentation features, including word segmentation and POS tagging, which have specific documentation, including data structure design, word steps, such a
SearchEngine
- Java实现的搜索引擎,有网页爬虫,查询服务,中文分词,索引建立等- realize search engine in Java
cut_cn
- java写的分词程序,界面很简单,很好用,内部的类封装的很好。-java program to write the sub-word, the interface is very simple, useful, well encapsulated within the class.